Wstęp

Niniejszy dokument podsumowuje prace poświęcone estymacji charakterystyk aktywności ekonomicznej ludności dla wybranych domen w przekroju podregionów. Badanie przeprowadzono niezależnie dla 1) danych rocznych oraz 2) danych kwartalnych. W przypadku danych rocznych określono 8 szczegółowych przekrojów (domen) na poziomie podregionów. W przypadku danych kwartalnych nie wyszczególniono przekrojów, skupiono się na oszacowaniach charakterystyk aktywności ekonomicznej ludności ogółem.

W badaniu określono następujące charakterystyki aktywności ekonomicznej ludności według definicji ILO (zmienne celu):

W przypadku danych rocznych określono następujące przekroje (domeny):

W projekcie podjęto decyzję o wykorzystaniu podejścia modelowego zakładającego rozkład wielomianowy zmiennej celu. W naszym przypadku zmienna celu składała się z trzech poziomów – pracujący (kod 1), bezrobotny (kod 3) oraz bierny (kod 4). Następnie, podjęto decyzję aby dla każdej grupy oszacować oddzielne modele.

Efektywna wielkość próby

W związku z tym, że w modelach nie wykorzstujemy zmiennych użytych do konstrukcji wag zachodzi potrzeba uwzględnienia schematu losowania poprzez wykorzystanie tzw. efektywnej wielkości próby. To podejście jest wykorzystywane w przypadku statystyki małych obszarów, a w szczególności estymacji bayesowskiej.

Efektywna wielkość próby dla rozkładu dwumianowego

Chen, Wakefield i Lumley (2014) zastosowali następujące podejście uwzględniające schemat losowania (wagi, wariancję) do estymacji z wykorzystaniem hierarchicznego modelu regresji logistycznej z wykorzystaniem INLA.

  1. Dla domeny \(i\) należy wyznaczyć estymator bezpośredni odsetka występowania cechy \(Y\) w populacji danej domeny według następującego wzoru

\[ \hat{P}_i = \frac{\sum_{k \in s_i} w_{ik}y_{ik}}{\sum_{k \in s_i} w_{ik}}, \]

gdzie \(w_{ik} = \pi_{ik}^{-1}\) to waga wynikajaca ze schematu losowania dla jednostki \(k\) w domenie \(i\) (próba \(s_{i}\)), a \(y_{ik}\) to zmienna celu przyjmująca dwa warianty \(\{0,1\}\).

  1. Dla domeny \(i\) należy wyznaczyć wariancję \(\hat{V}_i = \widehat{var}(\hat{P}_i)\) uwzględniając schemat losowania. W tym celu można wykorzystać na przykład bootstrap.

  2. Następnie należy wyznaczyć efektywną wielkość próby oznaczoną przez \(m_i^*\). Przy założeniu losowania prostego i rozkładu dwumianowego można ją wyznaczyć zgodnie z następującym wzorem

\[ m^*_i = \frac{\hat{P}_i(1-\hat{P}_i)}{\hat{V}_i}, \]

gdzie symbole zdefiniowane są jak wyżej.

  1. Następnie, dla każdej domeny wyznacza się \(y^*_i = m^*_i \times \hat{P}_i\) i parę \((y^*i, m^*_i)\) wykorzystuje się do modelu regresji logistycznej zakładając rozkład dwumianowy.

W przypadku założenia rozkładu wielomianowego powyższe podejście będzie skutkować w \(l\) efektywnych wielkościach próby ponieważ wariancję wyznaczamy dla każdego poziomu.

Efektywna wielkość próby dla rozkładu wielomianowego

W projekcie zastosowano podejście opisane w pracy Ghitza i Gelman (2013) składające się z następujących kroków

  1. Dla domeny \(i\) należy wyznaczyć estymator bezpośredni (lub GREG) odsetka występowania cechy \(Y_l\) o poziomie \(l\) w populacji danej domeny według następującego wzoru

\[ \hat{P}_{il} = \frac{\sum_{k \in s_i} w_{ik}y_{ilk}}{\sum_{k \in s_i} w_{ik}}, \]

gdzie \(w_{ilk} = \pi_{ilk}^{-1}\) to waga wynikajaca ze schematu losowania dla jednostki \(k\) w domenie \(i\) dla \(l\)-tego poziomu cechy \(y\), a \(y_{ilk}\) to zmienna celu przyjmująca dwa warianty \(\{0,1\}\).

  1. Dla każdej domeny należy wyznaczyć efekt schematu losowania zgodnie z danym wzorem

\[ deff_i = 1 + \left( \frac{\text{sd}(w_{ik})}{\text{mean}(w_{ik})} \right)^2, \]

gdzie \(\text{sd}(w_{ik})\) to odchylenie standardowe wag przypisanych poszczególnym jednostkom w danej domenie, a \(\text{mean}(w_{ik})\) to średnia arytmetyczna tych wag.

  1. Następnie należy wyznaczyć efektywną wielkość próby

\[ m^*_i = n_i / deff_i, \]

oraz \(y^*_{il} = m^*_i \times \hat{P}_{il}\). Następnie \((m^*_i, y^*_{i1}, ..., y^*_{il})\), gdzie \(l=1,..,L\) wykorzystujemy do modelu wielomianwego.

Porównanie rozkładów

Poniższe wykresy prezentują porównanie 1) odsetków przeważonych oraz nieprzeważonych oraz 2) porównanie wielkości próby oraz wyznaczonej efektywnej wielkości próby.

Porównanie odsetków przeważonych oraz nieprzeważonych

Porównanie odsetków dla danych rocznych

Porównanie odsetków dla danych rocznych

Porównanie odsetków dla danych kwartalnych

Porównanie odsetków dla danych kwartalnych

Porównanie liczebności i efektywnej liczebności próby

Zastosowane modele

Model 2

Opisane w poprzednim raporcie

Model 3

Opisane w poprzednim raporcie

Wykorzystane zmienne pomocnicze

W związku z ograniczonym dostępem do zmiennych pomocniczych podjęto decyzję o wykorzystaniu następującego wskaźnika

\[ \text{udzial bezrobotnych zarejestrowanych} = \frac{\text{ liczba bezrobotnych zarejestrowanych w danej domenie }} { \text{wielkość populacji 16+ w domenie} } \]

Ten wskaźnik został wyznaczony niezależnie dla danych rocznych i kwartalnych oraz domen. Niestety, nie dla wszystkich domen dysponowaliśmy zmiennymi pomocniczymi na odpowiednich poziomach.

Dodatkowo wykorzystano, w zależości od modelu, następujące zmienne:

  • czy podregion jest miastem? Podregiony ‘0112121’, ‘0510116’, ‘0230162’, ‘0232165’, ‘0714128’, ‘0302105’.
  • kwartał (ref = I kw)

Opis wyników

Badanie zależności między zmiennymi

Dane roczne

Poniższe wykresy przedstawiają zależności między logarytmami liczby pracujących do biernych oraz liczby bezrobotnych do biernych wyliczone na podstawie \(m^*_{il}\) oraz zmiennej pomocniczej według domen dla danych rocznych za lata 2006-2015.

Dane kwartalne

Poniższe wykresy przedstawiają zależności między logarytmami liczby pracujących do biernych oraz liczby bezrobotnych do biernych wyliczone na podstawie \(m^*_{il}\) dla danych kwartalnych za lata 2010-2016.

Wyniki estymacji – oszacowania punktowe

Wyniki dla danych rocznych

Modele

Podsumowanie:

  • w przypadku przekroju 25-54 nie udało się oszacować ani modelu 2, ani 3 – oszacowany zostanie model 1 (bez autokorelacji w czasie),
  • w przypadku modelu 3 dla niektórych przekrojów pojawia się komunikat The value of the variance component is negative: the initial value is taken oznacza to, że model nie został poprawnie oszacowany – należy skłonić się w takim przypadku w stronę modelu 2,
  • we wszystkich modelach parametry mają odpowiednie znaki.
## 
## ================== przekroj:  15-24  ================== 
## 
## ================== model 2 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept       -0.813    0.0421   0e+00
## bezr_reg_udz    -0.471    0.0931   4e-07
## Intercept       -2.788    0.0462   0e+00
## bezr_reg_udz2    1.983    0.1202   0e+00
## 
## Random effects
##      Estimate Std.Error p.value
## [1,]   0.0577  9.78e-03       0
## [2,]   0.0301  5.12e-05       0
## [3,]   0.0142  5.12e-05       0
## [4,]   0.0321  3.29e-03       0
## 
## ================== model 3 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept       -0.819    0.0419 0.0e+00
## bezr_reg_udz    -0.453    0.0933 1.2e-06
## Intercept       -2.784    0.0464 0.0e+00
## bezr_reg_udz2    1.985    0.1238 0.0e+00
## 
## Random effects
##      Estimate Std.dev  p.value
## [1,]   0.0480 0.00875 4.00e-08
## [2,]   0.0324 0.00780 3.35e-05
## [3,]   0.0244 0.00199 0.00e+00
## [4,]   0.0562 0.00480 0.00e+00
## 
## Correlation random effects
##      Estimate Std.Error  p.value
## [1,]    0.250    0.0658 1.46e-04
## [2,]    0.296    0.0678 1.26e-05
## 
## 
## The value of the variance component is negative: the initial value is taken
## ================== przekroj:  20-59/64  ================== 
## 
## ================== model 2 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept        1.115    0.0346       0
## bezr_reg_udz    -0.431    0.0756       0
## Intercept       -2.273    0.0487       0
## bezr_reg_udz2    2.607    0.1075       0
## 
## Random effects
##      Estimate Std.Error p.value
## [1,]   0.0293  4.99e-03       0
## [2,]   0.0533  3.46e-05       0
## [3,]   0.0124  3.46e-05       0
## [4,]   0.0221  1.72e-03       0
## 
## ================== model 3 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept        1.094    0.0358       0
## bezr_reg_udz    -0.391    0.0633       0
## Intercept       -2.282    0.0472       0
## bezr_reg_udz2    2.623    0.1051       0
## 
## Random effects
##      Estimate  Std.dev  p.value
## [1,]  0.00746 0.007252 3.04e-01
## [2,]  0.04039 0.008777 4.18e-06
## [3,]  0.00999 0.000746 0.00e+00
## [4,]  0.04196 0.002899 0.00e+00
## 
## Correlation random effects
##      Estimate Std.Error p.value
## [1,]    0.819    0.0474       0
## [2,]    0.413    0.0546       0
## 
## 
## The value of the variance component is negative: the initial value is taken
## ================== przekroj:  55-59/64  ================== 
## 
## ================== model 2 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept        -1.21    0.0585       0
## bezr_reg_udz      4.25    0.1542       0
## Intercept        -3.86    0.0638       0
## bezr_reg_udz2     4.57    0.2291       0
## 
## Random effects
##      Estimate Std.Error p.value
## [1,]   0.1507  0.025354       0
## [2,]   0.0599  0.000082       0
## [3,]   0.0439  0.000082       0
## [4,]   0.0626  0.007561       0
## 
## ================== model 3 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept       -0.711    0.0687       0
## bezr_reg_udz     1.917    0.2146       0
## Intercept       -3.763    0.0725       0
## bezr_reg_udz2    4.021    0.2816       0
## 
## Random effects
##      Estimate Std.dev  p.value
## [1,]   0.0681  0.0220 0.002003
## [2,]   0.0663  0.0184 0.000327
## [3,]   0.0413  0.0031 0.000000
## [4,]   0.1457  0.0129 0.000000
## 
## Correlation random effects
##      Estimate Std.Error p.value
## [1,]    0.747    0.0509 0.0e+00
## [2,]    0.334    0.0701 1.9e-06
## 
## 
## The value of the variance component is negative: the initial value is taken
## ================== przekroj:  female  ================== 
## 
## ================== model 2 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept      -0.0354    0.0233   0.128
## bezr_reg_udz   -0.7044    0.0664   0.000
## Intercept      -3.2979    0.0462   0.000
## bezr_reg_udz2   3.3078    0.1410   0.000
## 
## Random effects
##      Estimate Std.Error p.value
## [1,]  0.01536  2.59e-03       0
## [2,]  0.04395  1.95e-05       0
## [3,]  0.00344  1.95e-05       0
## [4,]  0.01997  1.85e-03       0
## 
## ================== model 3 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept      -0.0415    0.0232  0.0733
## bezr_reg_udz   -0.6903    0.0662  0.0000
## Intercept      -3.3164    0.0465  0.0000
## bezr_reg_udz2   3.3599    0.1433  0.0000
## 
## Random effects
##      Estimate  Std.dev p.value
## [1,]  0.01351 0.002538   1e-07
## [2,]  0.03835 0.007378   2e-07
## [3,]  0.00225 0.000279   0e+00
## [4,]  0.01722 0.001751   0e+00
## 
## Correlation random effects
##      Estimate Std.Error p.value
## [1,]    0.664    0.0786   0e+00
## [2,]    0.411    0.0774   1e-07
## 
## 
## ================== przekroj:  male  ================== 
## 
## ================== model 2 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error  p.value
## Intercept        0.536    0.0259 0.000000
## bezr_reg_udz    -0.291    0.0771 0.000165
## Intercept       -2.712    0.0446 0.000000
## bezr_reg_udz2    3.246    0.1503 0.000000
## 
## Random effects
##      Estimate Std.Error p.value
## [1,]  0.01938  0.003278   3e-09
## [2,]  0.02916  0.000033   0e+00
## [3,]  0.00505  0.000033   0e+00
## [4,]  0.02567  0.002208   0e+00
## 
## ================== model 3 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept        0.566    0.0240       0
## bezr_reg_udz    -0.434    0.0717       0
## Intercept       -2.704    0.0432       0
## bezr_reg_udz2    3.217    0.1470       0
## 
## Random effects
##      Estimate  Std.dev p.value
## [1,]  0.00367 0.003383 0.27766
## [2,]  0.02143 0.006550 0.00107
## [3,]  0.00751 0.000632 0.00000
## [4,]  0.05701 0.004097 0.00000
## 
## Correlation random effects
##      Estimate Std.Error p.value
## [1,]    0.763    0.0529       0
## [2,]    0.394    0.0565       0
## 
## 
## The value of the variance component is negative: the initial value is taken
## ================== przekroj:  rural  ================== 
## 
## ================== model 2 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept        0.219    0.0275       0
## bezr_reg_udz    -0.450    0.0647       0
## Intercept       -2.798    0.0478       0
## bezr_reg_udz2    2.071    0.1378       0
## 
## Random effects
##      Estimate Std.Error p.value
## [1,]   0.0255  4.52e-03   2e-08
## [2,]   0.0364  2.79e-05   0e+00
## [3,]   0.0053  2.79e-05   0e+00
## [4,]   0.0379  3.13e-03   0e+00
## 
## ================== model 3 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept        0.210    0.0267       0
## bezr_reg_udz    -0.429    0.0627       0
## Intercept       -2.799    0.0486       0
## bezr_reg_udz2    2.080    0.1421       0
## 
## Random effects
##      Estimate  Std.dev  p.value
## [1,]  0.01535 0.003456 8.92e-06
## [2,]  0.02995 0.008742 6.12e-04
## [3,]  0.00779 0.000661 0.00e+00
## [4,]  0.07164 0.005285 0.00e+00
## 
## Correlation random effects
##      Estimate Std.Error p.value
## [1,]    0.590    0.0616       0
## [2,]    0.357    0.0587       0
## 
## 
## The value of the variance component is negative: the initial value is taken
## ================== przekroj:  urban  ================== 
## 
## ================== model 2 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept        0.183    0.0241   0e+00
## bezr_reg_udz    -0.397    0.0728   1e-07
## Intercept       -2.872    0.0410   0e+00
## bezr_reg_udz2    2.879    0.1402   0e+00
## 
## Random effects
##      Estimate Std.Error p.value
## [1,]  0.01522  2.61e-03   5e-09
## [2,]  0.01867  2.47e-05   0e+00
## [3,]  0.00539  2.47e-05   0e+00
## [4,]  0.03072  2.44e-03   0e+00
## 
## ================== model 3 ==================
## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept        0.201    0.0228       0
## bezr_reg_udz    -0.490    0.0689       0
## Intercept       -2.874    0.0412       0
## bezr_reg_udz2    2.874    0.1416       0
## 
## Random effects
##      Estimate  Std.dev  p.value
## [1,]  0.00931 0.002195 2.23e-05
## [2,]  0.01670 0.005173 1.25e-03
## [3,]  0.00709 0.000569 0.00e+00
## [4,]  0.05468 0.003886 0.00e+00
## 
## Correlation random effects
##      Estimate Std.Error p.value
## [1,]    0.573    0.0585       0
## [2,]    0.328    0.0566       0
## 
## 
## The value of the variance component is negative: the initial value is taken

Porównanie oszacowań

Wyniki dla danych kwartalnych

Modele

Model 2

## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error p.value
## Intercept      0.22014   0.02565  0.0000
## bezr_reg_udz  -1.47329   0.29252  0.0000
## miasto         0.10965   0.05818  0.0595
## kw1           -0.02294   0.00590  0.0001
## kw2           -0.01212   0.00541  0.0251
## kw3            0.00509   0.00539  0.3445
## Intercept     -3.06599   0.05150  0.0000
## bezr_reg_udz2 13.86127   0.65533  0.0000
## miasto2        0.15379   0.09347  0.0999
## kw1_2         -0.00219   0.01384  0.8745
## kw2_2         -0.00539   0.01291  0.6766
## kw3_2          0.01046   0.01296  0.4195
## 
## Random effects
##      Estimate Std.Error p.value
## [1,]  0.01799  2.90e-03       0
## [2,]  0.04444  1.46e-05       0
## [3,]  0.00198  1.46e-05       0
## [4,]  0.01367  1.15e-03       0

Model 3

## 
## Multinomial mixed effects model
## 
## Call:
## 
## Coefficients
##               Estimate Std.Error  p.value
## Intercept      0.22938   0.02848 0.000000
## bezr_reg_udz  -1.63621   0.35880 0.000005
## miasto         0.11112   0.05666 0.049853
## kw1           -0.02023   0.00537 0.000168
## kw2           -0.01118   0.00465 0.016240
## kw3            0.00583   0.00453 0.198923
## Intercept     -2.89881   0.05344 0.000000
## bezr_reg_udz2 11.29995   0.74558 0.000000
## miasto2        0.07583   0.07501 0.312053
## kw1_2          0.00847   0.01208 0.483339
## kw2_2         -0.00670   0.01088 0.537965
## kw3_2          0.00261   0.01064 0.806345
## 
## Random effects
##      Estimate  Std.dev  p.value
## [1,] 0.016121 0.002764 5.00e-09
## [2,] 0.021958 0.004809 4.97e-06
## [3,] 0.000747 0.000134 2.50e-08
## [4,] 0.006637 0.000857 0.00e+00
## 
## Correlation random effects
##      Estimate Std.Error p.value
## [1,]    0.829    0.0453       0
## [2,]    0.797    0.0384       0

Porównanie oszacowań

Wyniki estymacji – oszacowania wariancji i względnego błędu szacunku

Do porównania wariancji oszacowań wykorzystano procedurę bootstrap dostępną w pakiecie mme::mseb, która została zmodyfikowana i usunięto drobne błędy. Procedura została opisana w następujących publikacjach:

  • Lopez-Vizcaino, ME, Lombardia, MJ and Morales, D (2013). Multinomial-based small area estimation of labour force indicators. Statistical Modelling, 13 ,153-178.
  • Lopez-Vizcaino, ME, Lombardia, MJ and Morales, D (2013). Small area estimation of labour force indicator under a multinomial mixed model with correlated time and area effects. Submitted for review.
  • Gonzalez-Manteiga, W, Lombardia, MJ, Molina, I, Morales, D, Santamaria, L (2008). Estimation of the mean squared error of predictors of small area linear parameters under a logistic mixed model, Computational Statistics and Data Analysis, 51, 2720-2733.

Dane roczne – porównanie względnego błędu szacunku

Statystyki opisowe w postaci tabelarycznej:

  • dir – estymator bezpośredni na podstawie wag z BAEL
  • greg – estymator kalibrowany na poziomie domeny
  • m2 – mme model 2
  • m3 – mme model 3